智能论文笔记

Scene Text Recognition with Permuted Autoregressive Sequence Models

Darwin Bautista , Rowel Atienza

分类：计算机视觉 | 自然语言处理

2022-07-14

上下文感知的str方法通常使用内部自回旋（AR）语言模型（LM）。 AR模型的固有局限性动机是采用外部LM的两阶段方法。输入图像上外部LM的条件独立性可能导致其错误地纠正正确的预测，从而导致明显的低效率。我们的方法Parseq使用置换语言建模学习了具有共同权重的内部AR LMS集合。它统一了无上下文的非AR和上下文感知的AR推断，并使用双向上下文统一了迭代的精致。使用合成训练数据，Parseq实现了最新的（SOTA），从而获得了Str基准（精度为91.9％）和更具挑战性的数据集。在对实际数据进行培训时，它建立了新的SOTA结果（精度为96.0％）。 Parseq由于其简单，统一的结构和平行的令牌处理，对准确性与参数计数，拖放和延迟非常最佳。由于其广泛使用了注意力，它对在现实世界图像中常见的任意导向文本具有鲁棒性。代码，预处理的权重和数据可在以下网址提供：https：//github.com/baudm/parseq。

translated by 谷歌翻译

A Semi-Supervised Algorithm for Improving the Consistency of Crowdsourced Datasets: The COVID-19 Case Study on Respiratory Disorder Classification

Lara Orlandic , Tomas Teijeiro , David Atienza

分类：人工智能

2022-09-09

咳嗽音频信号分类是筛查呼吸道疾病（例如COVID-19）的潜在有用工具。由于从这种传染性疾病的患者那里收集数据是危险的，因此许多研究团队已转向众包来迅速收集咳嗽声数据，因为它是为了生成咳嗽数据集的工作。 Coughvid数据集邀请专家医生诊断有限数量上传的记录中存在的潜在疾病。但是，这种方法遭受了咳嗽的潜在标签，以及专家之间的显着分歧。在这项工作中，我们使用半监督的学习（SSL）方法来提高咳嗽数据集的标签一致性以及COVID-19的鲁棒性与健康的咳嗽声音分类。首先，我们利用现有的SSL专家知识聚合技术来克服数据集中的标签不一致和稀疏性。接下来，我们的SSL方法用于识别可用于训练或增加未来咳嗽分类模型的重新标记咳嗽音频样本的子样本。证明了重新标记的数据的一致性，因为它表现出高度的类可分离性，尽管原始数据集中存在专家标签不一致，但它比用户标记的数据高3倍。此外，在重新标记的数据中放大了用户标记的音频段的频谱差异，从而导致健康和COVID-19咳嗽之间的功率频谱密度显着不同，这既证明了新数据集的一致性及其与新数据的一致性及其与新数据的一致性的提高，其解释性与其与其解释性的一致性相同。声学的观点。最后，我们演示了如何使用重新标记的数据集来训练咳嗽分类器。这种SSL方法可用于结合几位专家的医学知识，以提高任何诊断分类任务的数据库一致性。

translated by 谷歌翻译

HDTorch: Accelerating Hyperdimensional Computing with GP-GPUs for Design Space Exploration

William Andrew Simon , Una Pale , Tomas Teijeiro , David Atienza

分类：机器学习

2022-06-09

对于涉及连续的，半监督的学习以进行长期监测的应用程序，高维计算（HDC）作为机器学习范式非常有趣。但是，其准确性尚未与其他机器学习（ML）方法相提并论。允许快速设计空间探索以找到实用算法的框架对于使高清计算与其他ML技术竞争是必要的。为此，我们介绍了HDTORCH，这是一个开源的，基于Pytorch的HDC库，其中包含用于HyperVector操作的CUDA扩展名。我们通过使用经典和在线HD培训方法来分析四个HDC基准数据集，从而证明了HDTORCH的实用程序。我们为经典/在线HD的平均（训练）/推理速度分别为（111x/68x）/87x。此外，我们分析了不同的超参数对运行时和准确性的影响。最后，我们演示了HDTORCH如何实现对大型现实世界数据集应用的HDC策略的探索。我们对CHB-MIT EEG癫痫数据库进行了首个高清训练和推理分析。结果表明，在一部分数据子集上训练的典型方法不一定会推广到整个数据集，这是开发医疗可穿戴设备的未来HD模型时的重要因素。

translated by 谷歌翻译

Adaptive R-Peak Detection on Wearable ECG Sensors for High-Intensity Exercise

Elisabetta De Giovanni , Tomas Teijeiro , Grégoire P. Millet , David Atienza

分类：机器学习

2021-12-08

目的：通过可穿戴传感器持续监测生物信号，在医疗和健康领域迅速扩展。在静止时，自动检测重要参数通常是准确的。然而，在诸如高强度运动的条件下，信号发生突然的生理变化，损害标准算法的鲁棒性。方法：我们的方法称为Bayeslope，是基于无监督的学习，贝叶斯滤波和非线性归一化，并根据ECG中的预期位置来增强和正确地检测R峰值。此外，随着贝叶克洛斯的计算沉重并且可以快速排出设备电池，我们提出了一种在线设计，可使其突然生理变化以及对现代嵌入式平台的异构资源的复杂性。该方法将Bayeslope与轻量级算法相结合，在具有不同能力的核心中执行，以减少能量消耗，同时保持精度。结果：贝森普洛普在激进的骑自行车运动中实现了99.3％的F1得分为99.3％。此外，在线自适应过程在五种不同的运动强度上实现了99％的F1得分，总能耗为1.55±0.54〜MJ。结论：我们提出了一种高度准确和稳健的方法，以及在现代超低功耗嵌入式平台中的完整节能实现，以提高攻击条件下的R峰值检测，例如在高强度运动期间。重要意义：实验表明，贝叶普洛斯在F1分数中优于8.4％的最先进的算法，而我们的在线自适应方法可以在现代异构可穿戴平台上达到高达38.7％的节能。

translated by 谷歌翻译

Multi-Centroid Hyperdimensional Computing Approach for Epileptic Seizure Detection

Una Pale , Tomas Teijeiro , David Atienza

分类：机器学习 | 神经与进化计算

2021-11-16

癫痫患者的长期监测来自实时检测和可穿戴设备设计的工程角度呈现出具有挑战性的问题。它需要新的解决方案，允许连续无阻碍的监控和可靠的癫痫发作检测和预测。在癫痫发作期间的人，脑状态和时间实例中存在脑电图（EEG）模式的高可变性，而且在非扣押期间。这使得癫痫癫痫发作检测非常具有挑战性，特别是如果数据仅在癫痫发作和非癫痫标签下分组。超方（HD）计算，一种新型机器学习方法，作为一个有前途的工具。但是，当数据显示高级别的可变性时，它具有一定的限制。因此，在这项工作中，我们提出了一种基于多心高清计算的新型半监督学习方法。多质心方法允许有几个代表癫痫发作和非癫痫发作状态的原型向量，这导致与简单的2级HD模型相比显着提高了性能。此外，现实生活数据不平衡造成了额外的挑战，并且在数据的平衡子集上报告的性能可能被高估。因此，我们测试我们的多质心方法，具有三个不同的数据集平衡方案，显示较少平衡数据集的性能提升更高。更具体地，在不平衡的测试集上实现了高达14％的改进，而不是比癫痫发作数据更加不癫痫发布的10倍。与此同时，与平衡数据集相比，子类的总数不会显着增加。因此，所提出的多质心方法可以是实现具有现实数据余额或在线学习期间实现高性能的重要因素，癫痫发作不常见。

translated by 谷歌翻译